"匯東華-認真作好每件事"
~統計,不再是阻力,而是助力~

BMJ小小統計問題(110):Risk (風險)

Cite this as: BMJ 2012;345:e6336

https://www.bmj.com/content/345/bmj.e6336

前言

這期BMJ小小統計詳細介紹「配額抽樣」在研究中的運作方式和其如何確保樣本的代表性。以倫敦人口為例,文中描述如何基於先前的人口普查數據確定不同分層的配額。此外,文章還提及使用配額抽樣可能會面臨的問題。透過本篇文章,可以更深入地了解稱樣方法背後原理和選擇抽樣方法時需要考慮之因素。

Hope u enjoy it

完整合輯請見學習專區/BMJ小小統計問題

10月份實體課程招生中,多種研究與統計課程等你挖掘

九月底新上市線上課程:eAI02-Step by Step ChatGPT與醫學研究寫作[Coming soon]

✨本公司提供【流行病學】與【生物統計學】線上課程

匯東華會員制詳情。

課程介紹與報名

 

問題

研究人員評估2005年7月7日倫敦爆炸事件後,倫敦市民的心理及行為反應。他們採用橫斷面電話調查,使用隨機數字撥號方法撥打所有倫敦的電話號碼。應答者被邀請參與一項有關當前壓力程度與旅行意願的訪談。總計有1010名參與者完成訪談。研究者使用按比例配額抽樣方式招募受訪者,抽樣標準為依據性別、年齡、工作狀態、居住地、住房情況及族群進行抽樣。

 

主要的調查結果顯示,由於爆炸事件,約31%的倫敦人出現大量壓力,32%的人表示在交通系統恢復正常後,他們的公共交通出行意願會減少。相比其他宗教信仰的受訪者,穆斯林的壓力程度顯著較高[1]。

 

按比例配額取樣代表為何?

a) 非機率抽樣 (Non-probability sampling)。

b) 非隨機抽樣 (Non-random sampling)。

c) 機率抽樣 (Probability sampling)。

d) 隨機抽樣 (Random sampling)。

 

答案

b) 非隨機抽樣 (Non-random sampling),有時也被稱為a)非機率抽樣 (Non-probability sampling)。

詳細說明

此種抽樣方法經常被用於調查及民意測驗,其中要調查的人數通常事先確定[2]。在本例中,研究者表示希望至少訪談1000名成人。其強調樣本必須能代表倫敦的人口結構,因此,樣本被分成不同的子群體或階層,這些階層包括性別、年齡、工作狀態等[2]。首先,樣本按性別劃分,然後在性別內部按年齡劃分,接著在年齡組內按工作狀態劃分,依此類推[2]。

 

調查樣本的成員是根據最近一次人口普查中記錄之倫敦人口的相同比例選取的,這些比例涉及性別、年齡組(18-24、25-44、45-64或≥65歲)、工作狀態(是否在工作)、居住地點(倫敦內部或外部)、住房所有權(房屋所有者、租房或其他)和種族(白人或其他)。一旦受訪者在分層之數量達到與倫敦人口相同的比例,達到預先定義的配額,即不再進行抽樣。

 

研究者報告,大約10%被撥打者完成訪談。一般而言,使用配額抽樣的電話調查中,回應率通常偏低,特別是當有特定的子群體需要被滿足時。

 

有兩種抽樣方法:隨機抽樣,有時稱為機率抽樣;和非隨機抽樣,有時稱為非機率抽樣。隨機抽樣涉及從人口成員中進行某種形式的隨機選擇。每一位人口成員被選中的機率都是已知的,且通常是相等的。簡單隨機抽樣(有時僅稱為隨機抽樣)是隨機抽樣的最直接例子。將建立一個抽樣框架,即屬於人口的所有人清單。建立抽樣框架需要知道誰在人口中。從這個名單中隨機選擇固定大小的樣本,人口中的所有成員被選中的機率都是相同的,互不影響。人口成員被選中的機率事前已知。只要樣本足夠大,由簡單隨機抽樣得到的樣本將代表研究人口。機率抽樣的其他例子包括集群抽樣[2]。

 

比例配額抽樣是一種非隨機(答案b)或非機率(答案a)抽樣,因為被選中為樣本的機率為未知。在本例中,使用隨機數字撥號來聯繫住在倫敦的人以評估他們的資格,因此所有住在倫敦的人(只要他們有電話)都有相等被聯繫的機率。因為他們可以從前次人口普查中估算出,所以預先知道住在倫敦的每一個分層中的人比例。因此,在調查開始前,可以計算出每個分層的成員被聯繫之機率。但是,當開始進行配額抽樣時,研究人員會根據一些特定的特徵(如年齡、性別、居住地點等)來設定一些分層的抽樣配額。[Showme補充說明:例如,可能需要10018-24歲的年輕人、50≥65歲的老年人等等。當某一分層的配額已經達到(如18-24歲的100名年輕人已經完成訪談)時,該分層的抽樣就會停止。在此情境下,當研究人員撥打電話想要進一步訪談新的受訪者時,他們不可能提前知道下一個接電話的人屬於哪一分層。若下一個接電話的人剛好是18-24歲的年輕人,則他將不會被選入樣本,因為此一分層的配額已經滿了。]另外,當一個電話撥出去,有可能是家裡的不同成員接的,他們可能具有不同的特徵。因此,在撥打電話之前,研究人員無法確定是否下一個被聯繫者會被納入樣本。所以,比例配額抽樣是非隨機抽樣的一個例子。非機率抽樣的其他類型包括雪球抽樣和便利抽樣[2][3]。

 

在上面的例子中,比例配額抽樣被用作隨機抽樣方法的替代,主要是因為它確保了所得到的樣本可代表倫敦的人口。若研究人員使用隨機抽樣方法調查1000人,則所得到的樣本未必能能代表倫敦人口在性別、年齡、工作狀態、居住地點、住房所有權和種族方面的情形。有可能與倫敦人口相比,某些分層會被過度代表或被低估。

 

[1] Rubin GJ, Brewin CR, Greenberg N, Simpson J, Wessely S. Psychological and behavioural reactions to the bombings in London on 7 July 2005: cross sectional survey of a representative sample of Londoners. BMJ 2005;331:606.

[2] Sedgwick P. Sampling III. BMJ 2010;340:c93.

[3] Sedgwick P. Sampling I. BMJ 2009;339:b5512.

 

#比例配額抽樣 (Proportional quota sampling) #非隨機抽樣 (Non-random sampling) #樣本代表性 (Sample representativeness) #非隨機抽樣 (Non-random sampling) #匯東華


想要了解更多流行病學研究設計,可以參考本司線上課程:流行病學總複習

 數據串接與清洗

數據是礦藏,數據清洗是挖出鑽石的第一步,尤其是巨量知識。數據清洗或串接執行過程需要細心與專注,且有可能會消耗許多時間和精力,就由我們來替各位處理掉這個大麻煩。

全民健保研究資料庫、國外大型資料庫資料非常齊全,種類多,需要串接與清洗,進行正規化後才能更進一步進行資料探勘與統計分析。




Fig1.同一個Project資料散落在不同tables,無法使用




Fig2.整併與清理為可分析的table




Fig.3整理和分析後形成有意義的知識


概念與流程示意圖

 教育培訓

課程規劃核心為以「學習者」為中心進行「傳承」

以學習者為中心,結合陳秀敏博士十多年來的統計實務以及教學經驗,設計適合學員學習方式,開設課程,達到有效學習。

 

開設線上統計學院

https://medata.teaches.cc/

SPSS基礎統計實戰班:第一次分析SCI研究就上手(上、下)

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=MPz2wqN0v2M

課程介紹2:https://www.youtube.com/watch?v=nd5A5duxO5E

 

臨床研究思維-Open your mind

課程網址:https://medata.teaches.cc/

課程介紹1:https://www.youtube.com/watch?v=yTHdBnCdSnY
課程介紹2 : https://www.youtube.com/watch?v=kE9tXraICqk

臨床研究基本原則 : https://www.youtube.com/watch?v=1tTApx1hjn0

 計畫撰寫與統計諮詢





為了讓匯東華的顧客與學員有更好的合作和消費體驗,故匯東華特別依據營業項目開發周邊產品,提供使用、購買。目前已有針對公共衛生師的題庫以及模擬試題,未來將針對醫學研究領域發展產品。